EvoClass
AI012
Mendalami Model Bahasa Besar
Agen Otonom, RLHF, dan Penyesuaian Keamanan
Tujuan Pembelajaran
- Analisiskomponen arsitektur agen GUI, termasuk modul perencanaan, pengambilan keputusan, dan refleksi dalam sistem agen ganda.
- Jelaskanmekanisme Pembelajaran Penguatan (RL) dan RLHF, khususnya peran model hadiah dan PPO dalam menyelaraskan perilaku agen dengan nilai-nilai manusia.
- Evaluasirisiko keamanan dan masalah keandalan pada agen otonom, termasuk kesalahan Out-of-Distribution (OOD), serangan jailbreak, dan gangguan lingkungan.